ÇOKLU REGRESYONDA GÜVEN ARALIKLARI Regresyon Katsayılarının Güven Aralıkları y ( i,,..., n) gözlemlerinin, xi ortalama ve i k ve normal dağıldığı varsayılsın. Herhangi bir ortalamalı ve C varyanslı normal dağılımdır. ˆ ˆ C varyansıyla birbirinden bağımsız regresyon katsayısının marinal dağılımı,,,,..., k (.6) istatistiklerinin her biri n p serbestlik dereceli t dağılır. C, elemanıdır. ( X X) matrisinin. köşegen,,,..., k regresyon katsayısı için yüzde ( ) güven aralığı, ˆ ˆ (.7) t/, np ˆ C t/, np ˆ C olarak kullanılır. Örnek.8 Teslim Süresi Verileri Örnek.de parametresi için %95 güven aralığı, ˆ ˆ t ˆ C t ˆ C.5,.5,.659 (.74)(.773).659 (.74)(.773).68.97 x x x... x k yˆ x ˆ ve (.8) olmak üzere, x, x,..., x k noktasında ortalama yanıt için yüzde ( ) güven aralığı,
/, np ( ) ( / ) /, np ( ) yˆ t ˆ x X X x E y x yˆ t ˆ x X X x (.9) Örnek.9 Teslim Süresi Verileri Örnek.deki teslim süresi verileri kullanıldığında x 8 olmak üzere, bu nokta için 75 ortalama teslim süresinin ortalama güven aralığı, 9..74.56794 Ey ( / x) 9..74.56794 7.66 E( y/ x ).78 Regresyon Katsayılarının Eş Zamanlı Güven Aralıkları Aynı örneklem verisi kullanılarak güven ve ön kestirim aralıkları oluşturulmak istendiğinde aralık kestirimlerinin bütün kümesi için aynı anda geçerli bir güven katsayısı belirlemek gerekir. Tümünün olasılıkla aynı anda doğru olduğu güven aralıkları ya da ön kestirim aralıkları kümesi, eş zamanlı ya da bileşik güven( ya da bileşik ön kestirim) aralıkları olarak adlandırılır. Tüm parametreleri için yüzde ( ) bileşik güven bölgesi, P ˆ X X ˆ pms Re s F, pn, p (.3) olarak kullanılır. Bu eşitsizlik eliptik şekilli bir bölgeyi tanımlar. Basit doğrusal regresyon için yukarıda belirtilen eşitsizlik aşağıdaki biçime indirgenir. n n i i i i n( ˆ ) x ( ˆ )( ˆ ) x ( ˆ ) MS Re s F,, n Doğrusal regresyon modelinde parametrelerin eş zamanlı aralık kestirimlerini elde etmek için bir genel yaklaşım daha vardır. Bu aralıklar aşağıdaki ifade kullanılarak oluşturulabilir: ˆ se( ˆ ),,,..., k (.3)
Burada, tüm aralıkların doğru olma olasılığı elde edilecek şekilde seçilmelidir. yı seçmek için birkaç yöntem kullanılabilir. Bu yöntemlerden biri, Bonferroni güven aralığıdır. Bu yaklaşımda, t / p, n p olarak alınır. Bonferroni güven aralığı, ˆ ˆ t / p, n pse( ),,,..., k (.3) olup güven katsayısı olarak yerine / p yi kullanmaktadır. Örnek. Roket Yakıtı Verileri ve parametreleri için %9 bileşik güven aralığı, ˆ t se( ˆ ) ˆ t se( ˆ ).5,8.5,8 67.8 (.445)(44.84) 67.8 (.445)(44.84) 59.79 735.85 ˆ t se( ˆ ) ˆ t se( ˆ ).5,8.5,8 37.54 (.445)(.889) 37.54 (.445)(.889) 44.8 3.9 nın seçiminde kullanılan tek yöntem, Bonferroni yöntemi değildir. Diğer yaklaşımlar, yı olarak alan Scheffe S yöntemi ve F /, pn, p u, p, n p olarak alan maksimum modül t yöntemidir. Burada u, p, n p, her biri n serbestlik dereceli iki bağımsız student-t raslantı değişkenlerinin maksimum mutlak değer dağılımının üst kuyruk noktasıdır.
*** Genellikle Bonferroni aralıkları, Scheffe aralıklarından daha kısadır; maksimum modül t aralıkları ise Bonferroni aralıklarından daha kısadır. YENİ GÖZLEMLERİN ÖNKESTİRİMİ x, x, x,..., x k iken x, x,..., x k noktasında gelecekteki bir y gözleminin nokta kestirimi, olmak üzere bu gözlem için yüzde ŷ ˆ x (.33) ( ) önkestirim aralığı, /, np ( ( ) /, np ( ( ) yˆ t ˆ x X X x y yˆ t ˆ x X X x (.34) olarak kullanılır. Örnek. Teslim Süresi Verileri Teslim hacmi x 8 ve servis elemanının yürümüş olduğu mesafe x 75 olduğunda ortalama teslim süresi için %95 önkestirim aralığı, x ( X X) x.5346 olmak üzere, x, 8, 75, yˆ ˆ x 9. ve 9..74.639(.5346) y 9..74.639(.5346) ve % 95 önkestirim aralığı, olarak bulunur..8 y 6.6
Ödev Öğrencilerin başarı durumları ile IQ düzeyleri arasında bir ilişki olduğu varsayılıyor. X; Öğrencilerin IQ düzeyleri X; Çalışma süresi Y; Notlar olmak üzere, Not (Y) 75 79 68 85 9 79 98 76 IQ (X) 5 6 3 4 Çalışma Sür. (X) 6 3 6 8 5 XX 5 3 7 58 95 4 8 53 Verilerin uyduğu çoklu regresyon modeli,,,,,,,3,, şeklinde olsun. a) Verilere göre regresyon parametrelerinin en küçük kareler tahmin değerlerini bulup modeli oluşturunuz. b) Kestrim ve artık değerlerini hesaplayınız. c) ANOVA tablosunu oluşturunuz.,5 düzeyinde modelin anlamlılığını inceleyiniz. değerini hesaplayıp yorumlayınız. d) Parametreler için,5 düzeyinde hipotez testi yapınız ve güven aralıklarını bulunuz.